<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
  <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
  <meta http-equiv="Content-Style-Type" content="text/css" />
  <meta name="generator" content="pandoc" />
  <title></title>
  <style type="text/css">code{white-space: pre;}</style>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript"></script>
</head>
<body>
<p>本课程包含了机器学习的基础知识，由台大老师林轩田讲授。</p>
<h3 id="第一周">第一周</h3>
<p>现在的机器学习方法在我们生活的各个方面都具有重要的影响。比如，它在我们日常的衣食 住行中扮演了一个越来越重要的角色，如下图所示：</p>
<div class="figure">
<img src="figure/ml_for_food_cloth_etc.jpg" />
</div>
<p>另外，推荐系统在我们的学习、娱乐等生活中也不可缺少（如豆瓣等）。</p>
<p>可以把机器学习所做的事情看作一个黑盒子，给定输入数据，经过这个黑盒之后，会给出输出结果，类似于下图：</p>
<div class="figure">
<img src="figure/ml_pipeline.jpg" />
</div>
<p>机器学习与数据挖掘的区别：</p>
<ul>
<li>数据挖掘通过给定数据以后，找出其中的某些重要特征</li>
<li>机器学习则通过给定数据后学习出一个预测函数，使得尽可能与目标一致</li>
</ul>
<h3 id="第二周-感知机学习">第二周 感知机学习</h3>
<h3 id="第三周-机器学习问题的分类">第三周 机器学习问题的分类</h3>
<p>二分类问题是机器学习的基本问题，从它出发，多分类问题应运而生。</p>
<ul>
<li>二/多分类问题</li>
<li>回归分析问题</li>
<li>结构学习</li>
</ul>
<p>按输入数据 1. 有监督学习：即相当于给定了一系列的带结果数据进行学习。 2. 无监督学习：只给数据了，但数据的结果并没有告知，让机器自己对这些结果进行学习 ，如聚类等问题。无监督学习的方法很多，而且很复杂。 3. 半监督学习： 4. 增强学习（reinforcement）：就像训练动物一样，逐渐地进行调整，以序列的方式进行 学习。</p>
<p>在训练的过程中，有多种方式。如一次性把数据全部用于学习（batch）、在线学习（ online）、从已经学到的结果中继续学习。<br />主动学习（Active Learning）：利用更少的标签来进行学习，用于标签不易进行的情况。</p>
<p>按输入来分：输入有具体输入，原始输入，抽象输入。</p>
<h3 id="第四周-学习的可行性">第四周 学习的可行性</h3>
<p><strong>No Free Lunch</strong>：没有办法对学习出来的结果作任何评价，除非作一些假设。</p>
<p>Hoefffding's Inequality：抽样估计的频率<span class="math">\(\nu\)</span>与真实概率<span class="math">\(\mu\)</span>关系为： <span class="math">\[P(\|\nu-\mu\| &gt; \epsilon) \leq 2\exp(-2\epsilon^2N)\]</span> 即告诉我们，如果抽样数越大，那么得到的频率与真实概率越接近。取样出来的结果大部分 和真实情况是一样的，但是不一样也是不可避免，只是说这种可能性比较小。</p>
<p><img src="figure/learning-1.jpg" /> <img src="figure/learning-2.jpg" /></p>
</body>
</html>
